With the boom of digital educational materials and scalable e-learning systems, the potential for realising AI-assisted personalised learning has skyrocketed. In this landscape, the automatic generation of educational questions will play a key role, enabling scalable self-assessment when a global population is manoeuvring their personalised learning journeys. We develop EduQG, a novel educational question generation model built by adapting a large language model. Our initial experiments demonstrate that EduQG can produce superior educational questions by pre-training on scientific text.
translated by 谷歌翻译
我们引入了综合学习,这是一个原则性的框架,将弱监督集成到机器学习模型的培训过程中。我们的方法共同训练末端模型和标签模型,该模型汇总了多个弱监督源。我们介绍了一个标签模型,该模型可以学会以不同的数据点的方式汇总弱监督源,并考虑训练期间终端模型的性能。我们表明,我们的方法在一组6个基准分类数据集中优于现有的弱学习技术。当出现少量标记的数据和弱监督时,性能的提高既一致又大,并且可靠地获得了2-5点测试F1分数在非整合方法中获得的增长。
translated by 谷歌翻译
在信息推荐人中,由于需要处理知识域之间的语义和层次结构,因此出现了许多挑战。这项工作旨在提前建立一个国家感知的教育推荐系统,该制度包括知识主题之间的语义相关性,在语义相关主题中传播潜在信息。我们介绍了一种新的学习模型,可以利用Wikipedia链接图来利用知识组件之间的这种语义相关性,旨在更好地预测终身学习情景中的学习者参与和潜在知识。从这个意义上讲,语义Truelearn在利用贝叶斯机器学习时建立了一种人类直观的知识表示,以提高教育参与的预测性能。我们的大型数据集的实验表明,这种新的Truelearn算法的语义版本在预测性能方面实现了统计上显着的改进,简单的扩展为模型增加了语义意识。
translated by 谷歌翻译
在NLP中,大量的任务涉及两种序列之间的成对比较(例如句子相似性和解释识别)。主要是,两种配方用于句子 - 对任务:双编码器和交叉编码器。双编码器产生固定尺寸句子表示,并且在计算上有效,但是,它们通常是跨编码器的表现不佳。交叉编码器可以利用他们的注意力头来利用句子间交互以获得更好的性能,但它们需要任务微调,并且计算更昂贵。在本文中,我们提出了一个完全无监督的句子表示模型被称为跨编码器,它将两个学习范例结合到迭代联合框架中,以同时学习增强的双和交叉编码器。具体而言,在预先接受训练的语言模型(PLM)的顶部,我们首先将其转换为无监督的双编码器,然后在双编码器任务配方之间交替。在每次交替中,一个任务制定将产生伪标签,该伪标签用作其他任务制定的学习信号。然后,我们提出了一种平行于多个PLMS在多个PLM上进行这种自蒸馏方法的延伸,并使用其伪标签的平均值进行互蒸馏。 Trans-encoder据我们所知,创建了第一个完全无监督的跨编码器以及用于句子相似性的最先进的无人监督的双编码器。跨编码器的双编码器和交叉编码器配方均最近提出了最先进的无监督句子编码器,例如镜像相似基准在句子相似基准上最多5%的镜像 - BERT和SIMCSE。
translated by 谷歌翻译
Multiwoz 2.0数据集极大地刺激了面向任务的对话系统的研究。但是,其状态注释包含大量噪声,这阻碍了对模型性能的正确评估。为了解决这个问题,大规模的努力致力于纠正注释。然后释放了三个改进的版本(即Multiwoz 2.1-2.3)。尽管如此,仍然有很多错误和不一致的注释。这项工作介绍了Multiwoz 2.4,该工作完善了Multiwoz 2.1的验证集和测试集中的注释。训练集中的注释保持不变(与多沃兹2.1相同),以引发强大的噪声模型训练。我们在Multiwoz 2.4上基准了八个最新的对话状态跟踪模型。所有这些表现出比Multiwoz 2.1的性能要高得多。
translated by 谷歌翻译
Multi-label ranking maps instances to a ranked set of predicted labels from multiple possible classes. The ranking approach for multi-label learning problems received attention for its success in multi-label classification, with one of the well-known approaches being pairwise label ranking. However, most existing methods assume that only partial information about the preference relation is known, which is inferred from the partition of labels into a positive and negative set, then treat labels with equal importance. In this paper, we focus on the unique challenge of ranking when the order of the true label set is provided. We propose a novel dedicated loss function to optimize models by incorporating penalties for incorrectly ranked pairs, and make use of the ranking information present in the input. Our method achieves the best reported performance measures on both synthetic and real world ranked datasets and shows improvements on overall ranking of labels. Our experimental results demonstrate that our approach is generalizable to a variety of multi-label classification and ranking tasks, while revealing a calibration towards a certain ranking ordering.
translated by 谷歌翻译
焊接联合检查(SJI)是生产印刷电路板(PCB)的关键过程。在SJI期间发现焊料错误非常具有挑战性,因为焊接接头的尺寸很小,并且可能需要各种形状。在这项研究中,我们首先表明焊料的特征多样性低,并且可以作为精细颗粒的图像分类任务执行SJI,该任务侧重于难以固定的对象类。为了提高细粒度的分类精度,发现通过最大化熵来惩罚自信模型预测,在文献中很有用。与此信息内联,我们建议使用{\ alpha} -skew Jensen-Shannon Divergence({\ alpha} -js)来惩罚模型预测的信心。我们将{\ alpha} -js正则化与现有基于熵指定的方法和基于注意机制,分割技术,变压器模型和特定损耗函数的方法进行比较。我们表明,在细化的焊料联合分类任务中,所提出的方法可以达到不同模型的F1得分和竞争精度。最后,我们可视化激活图,并表明,凭借熵的规范化,更精确的类歧视区域是局部的,这也更适合噪声。接受代码将在这里接受。
translated by 谷歌翻译
全球定位系统(GPS)已成为我们日常生活的一部分,其主要目标是提供地理位置服务。对于无人驾驶系统(UAS),地理定位能力是极为重要的必要性,使用惯性导航系统(INS)伴随着GPS的心脏而实现。没有地理位置服务,UAS将无法飞往目的地或回家。不幸的是,GPS信号可能会被堵塞,并在Urban Canyons中遇到多路径问题。我们的目标是提出一种替代方法,以降级或拒绝GPS信号时地理位置化UA。考虑到UAS在其平台上具有下降摄像头,可以在平台飞行时获得实时图像,因此我们将现代深度学习技术应用于地理定位。特别是,我们执行图像匹配,以在UAS获得的图像和卫星正尾之间建立潜在特征共轭物。特征匹配的典型应用遭受高层建筑物和该领域的新结构的影响,这些建筑物将不确定性引入同型估算中,因此导致地理定位性能差。取而代之的是,我们将GIS信息从OpenStreetMap(OSM)提取到语义段匹配的功能中,以纳入建筑物和地形类。 GIS掩码在选择语义匹配的功能时可以作为过滤器,从而增强了Coplanarity条件和UAS地理定位精度。发表论文后,我们的代码将在https://github.com/osupcvlab/ubiheredrone2021上公开获得。
translated by 谷歌翻译
本文介绍了一种新颖的端到端无人空中系统(UAS)导航方法,用于现实世界中的远程视觉导航。受到人类本能的双过程视觉导航系统的启发:环境理解和地标识别,我们将UAS导航任务分为两个相同的阶段。我们的系统结合了增强学习(RL)和图像匹配方法。首先,代理在指定环境中使用RL学习导航策略。为了实现这一目标,我们为培训过程设计了一个交互式的UASNAV环境。一旦代理商学习了导航政策,这意味着“熟悉环境”,我们就让UAS在现实世界中飞行,以使用图像匹配方法识别地标,并根据知识渊博的政策采取行动。在导航过程中,UAS嵌入单个相机作为唯一的视觉传感器。我们证明,UAS可以学习在现实世界中最短的道路上距离起点几百米的目的地。
translated by 谷歌翻译
本文研究了社会经济因素是否对于佛罗里达电力系统的飓风表现很重要。使用随机森林分类器进行调查,其准确性平均降低(MDA),以衡量一组因素的重要性,包括危害强度,最大影响时间恢复时间以及受影响人群的社会经济特征。这项研究的数据集(在县规模上)包括来自美国5年社区调查(ACS)的社会经济变量,风速以及五次飓风的停电数据,包括2018年Alberto和Michael,2019年,Dorian,Dorian,Dorian,以及ETA和ISAIA在2020年。研究表明,社会经济变量对系统性能模型非常重要。这表明在发生停电的发生中可能存在社会差异,这直接影响了社区的弹性,因此需要立即关注。
translated by 谷歌翻译